Loading...
机构名称:
¥ 1.0

摘要。新兴的 IT 运营人工智能 (AIOps) 领域利用监控数据、大数据平台和机器学习来自动化复杂 IT 系统中的运营和维护 (O&M) 任务。可用的研究数据通常只包含单一信息源,通常是日志或指标。单一源数据无法描述分布式系统的精确状态,导致方法无法有效利用联合信息,从而产生大量错误预测。因此,当前的数据限制了 AIOps 研究取得更大进展的可能性。为了克服这些限制,我们创建了一个复杂的分布式系统测试平台,它生成由分布式跟踪、应用程序日志和指标组成的多源数据。本文详细描述了基础设施、测试平台和生成数据的实验。此外,它还确定了如何利用这些数据作为开发异常检测、根本原因分析和补救等 O&M 任务新方法的垫脚石。测试平台的数据及其代码可在 https://zenodo 上获得。org/record/3549604 。

用于人工智能分析的多源分布式系统数据

用于人工智能分析的多源分布式系统数据PDF文件第1页

用于人工智能分析的多源分布式系统数据PDF文件第2页

用于人工智能分析的多源分布式系统数据PDF文件第3页

用于人工智能分析的多源分布式系统数据PDF文件第4页

用于人工智能分析的多源分布式系统数据PDF文件第5页

相关文件推荐